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1. GENERALIDADES 


1.1. INTRODUgAO 

Por onde quer que se olhe ou escute uma colegao de numeros sao normalmente enunciados 
como estatisticas. Estes numeros referem-se aos mais di versos campos de atividades: esportes, 
economia, finangas, etc. Assim tem-se por exemplo: 

• O numero de carros vendidos no pais aumentou em 30%. 

• A taxa de desemprego atinge, hoje, 7,5%. 

• As agoes da Telebras subiram R$ 1,5, hoje. 

• Resultados do Carnaval no transito: 145 mortos, 2430 feridos. 

Um numero e denominado uma estatistica (singular). No fechamento da bolsa as agoes da 
Vale foram cotadas a R$ 45.50. As vendas de uma empresa no mes constituem uma estatistica. Ja uma 
colegao de numeros ou fatos e denominado de estatfsticas (plural). Por exemplo, As vendas da 
empresa Piculnhas totalizaram: 2,5 milhoes em janeiro, 2,7 em fevereiro e 3.1 em margo. No entanto o 
termo Estatistica tern um sentido muito mais amplo, do que apenas numeros ou colegao de numeros. A 
Estatistica pode ser definida como: 

A ciencia de coletar, organizar, apresentar, analisar e interpretar dados numericos com 
o objetivo de tomar melhores decisoes. 

Assim como advogados possuem “regras de evidencia” e contabilistas possuem “praticas 
comumente aceitas”, pessoas que tratam com dados numericos seguem alguns procedimentos padroes. 
Alguns destes metodos serao vistos no que se denomina de estatistica descritiva. 


1.2. DIVISAO DA ESTATISTICA 

A Estatistica que lida com a organizagao, resumo e apresentagao de dados numericos e 
denominada de Estatistica Descritiva. Assim pode-se definir a Estatistica Descritiva como sendo: 

Os procedimentos usados para organizar, resumir e apresentar dados numericos. 

Conjuntos de dados desorganizados sao de pouco ou nenhum valor. Para que os dados se 
transformem em informagao e necessario organiza-los, resumi-los e apresenta-los. O resumo de 
conjuntos de dados e feito atraves das medidas e a organizagao e apresentagao atraves das distribuigoes 
de freqiiencias e dos graficos ou diagramas. 

Estatistica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade nao 
e possivel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto. 
O principal motivo para se trabalhar com uma parte do conjunto ao inves do conjunto inteiro e o custo. 

O conjunto de todos os elementos que se deseja estudar e denominado de populagao. Note-se 
que o termo populagao e usado num sentido amplo e nao significa, em geral, conjunto de pessoas. 
Pode-se definir uma populagao como sendo: 

Uma colegao de todos os possiveis elementos, objetos ou medidas de interesse. 

Assim, sao exemplos de populagoes: 

1. O conjunto das rendas de todos os habitantes de Porto Alegre; 

2. O conjunto de todas as notas dos alunos de Estatistica; 
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3. O conjunto das alturas de todos os alunos da Universidade; etc. 


Um levantamento efetuado sobre toda uma populagao e dito de levantamento censitarip 
ou simplesmente censo. 

Fazer levantamentos, estudos, pesquisas, sobre toda uma populagao (censo) e, em geral, muito 
diffcil. Isto se deve a varios fatores. O principal e o custo. Um censo custa muito caro e demanda um 
tempo consideravel para ser realizado. Assim, normalmente, se trabalha com partes da populagao 
denominadas de amostras. Uma amostra pode ser caracterizada como: 

Uma porgao ou parte de uma populacao de interesse. 

Utilizar amostras para se ter conhecimento sobre populates e realizado intensamente na 
Agricultura, Polftica, Negocios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos: 

• Antes da eleigao diversos orgaos de pesquisa e imprensa ouvem um conjunto selecionado de 
eleitores para ter uma ideia do desempenho dos varios candidatos nas futuras eleigoes. 

• Uma empresa metal-mecanica toma uma amostra do produto fabricado em intervalos de 
tempo especificados para verificar se o processo esta sob controle e evitar a fabricagao de itens 
defeituosos. 

• O IBGE faz levantamentos periodicos sobre emprego, desemprego, inflagao, etc. 

• Redes de radio e tv se utilizam constantemente dos indices de popularidade dos programas 
para fixar valores da propaganda ou entao modificar ou eliminar programas com audiencia 
insatisfatoria. 

• Biologos marcam passaros, peixes, etc. para tentar prever e estudar seus habitos. 

O processo de escolha de uma amostra da populacao e denominado de amostragem. 

Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decisoes 
sobre toda a populagao com base em apenas uma parte dela. A teoria da probabilidade pode ser 
utilizada para fomecer uma ideia do risco envoi vido, ou seja, do erro que se comete ao utilizar uma 
amostra ao inves de toda a populagao, desde que, e claro, a amostra seja selecionada atraves de 
criterios probabilfsticos, isto e, ao acaso. 

Baseado nos conceitos anteriores pode-se definir Estatistica Indutiva ou Inferencial como: 

A colegao de metodos e tecnicas utilizados para se estudar uma populagao baseados em 
amostras probabilfsticas desta mesma populagao. 

1.3. MENSURAL AO 
1.3.1. INTRODUQAO 

O processo de selecionar o modelo matematico ou estatfstico a ser utilizado com uma dada 
tecnica de pesquisa ou procedimento operacional envolve algumas decisoes importantes. A tomada de 
decisao do modelo matematico ou estatfstico a ser aplicado costuma ser precedida pela mensuragao do 
fenomeno envolvido. E uma primeira dificuldade surge na necessidade de se definir o que e 
mensuragao. Se o termo se referir somente aqueles tipos de medidas comumente utilizados em ciencias 
tais como a ffsica (por exemplo: medidas de comprimento, massa ou tempo) nao havera muitos 
problemas na escolha do sistema matematico. Mas se o conceito de medida for amplo o suficiente para 
incluir certos procedimentos de categorizagao normalmente utilizados em Ciencias Sociais, entao o 
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problema torna-se mais complexo. Pode-se distinguir entre diversos nfveis de mensuragao e para cada 
um existem diferentes modelos estatfsticos apropriados. 

1 . 3 . 2 . Formas de mensuracao 

Existem quatro formas de mensuragao ou tipos ou nfveis de medidas ou ainda escalas que sao 
conhecidas como: nominal, ordinal, intervalar e razao. 

Nivel nominal. A operagao basica e mais simples em qualquer ciencia e a de classificagao. Na 
classificagao tenta-se separar conjuntos de elementos com respeito a certas categorias, tomando 
decisoes sobre quais elementos sao mais parecidos e quais sao diferentes. O objetivo e colocar os 
elementos em categorias tao homogeneas quanto possfvel quando comparados com as diferengas 
existentes entre as categorias. 

Os termos nfvel nominal de medida ou escala nominal sao utilizadas para se referir a aqueles 
dados que so podem ser classificados em categorias. Se bem que no sentido estrito nao existe na 
realidade uma medida ou escala envoi vida. Existe apenas uma contagem. Variaveis que podem ser 
colocadas nesta categoria sao, por exemplo, a classificagao das pessoas quanto a religiao, sexo, estado 
civil, etc. Nao existe uma ordem particular entre as categorias ou grupos e alem disso duas categorias 
quaisquer sao mutuamente excludentes, isto e, uma pessoa nao pode ser ao mesmo tempo catolico e 
protestante. Alem disso as categorias sao exaustivas, significando que um membro da populagao deve 
aparecer em uma e somente uma das categorias. Observe a tabela um abaixo. 


Tabela 1.1 - Exemplo de variavel nominal 


Estado civil 

Numero de pessoas 

Casado 

340 

Solteiro 

250 

Viuvo 

40 

Divorciado 

50 

Total 

700 


Deve-se ser salientado que as classes ou categorias podem ser rotuladas com numeros, mas 
isto nao significa as operagoes aritmeticas com estes numeros tenham algum significado em particular. 
Neste caso os numeros exercem a mesma fungao dos nomes, isto e, identificar a categoria. 

Nivel ordinal. O nfvel ordinal e o tipo nominal em que se pode ordenar as categorias. A unica 
diferenga entre os dois nfveis e a relagao de ordem que se pode estabelecer entre as categorias. No 
entanto, nao e possfvel afirmar o quanto uma categoria e maior do que a anterior, isto e, nao se pode 
afirmar o quanto uma categoria possui da caracterfstica. A avaliagao atraves de conceitos e feita por 
uma escala ordinal. Veja um exemplo na tabela dois abaixo. 


Tabela 1.2 - Exemplo de variavel em escala ordinal 


Conceitos 

Numero de alunos 

A 

4 

B 

6 

C 

15 

D 

3 

E 

2 

Total 

30 
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Nao se pode afirmar neste caso que quem tirou A teve um numero de acertos duas vezes 
maior que quem tirou C. A unica coisa que se sabe e que quem tern A acertou mais questoes do quem 
tern B e este de quem tern C e assim por diante. As famflias podem ser classificadas de acordo com seu 
estatus socio economico em: alta, media alta, media, media baixa, baixa. Nao e possivel entretanto 
afirmar que a diferenga entre a alta e a media alta seja a mesma que entre a media e a media baixa. 

Nivel intervalar. No sentido estrito da palavra o termo mensuragao pode ser utilizado para se 
referir a situagoes em que se pode, nao somente ordenar objetos com respeito ao grau de que eles 
possuem certa caracterfstica, mas tambem indicar a exata distancia entre eles. Isto e possivel atraves de 
uma escala denominada de "escala de intervalos". 

A escala de medida intervalar e uma escala nominal em que a distancia entre as categorias, ao 
contrario da ordinal, e sempre a mesma. Ou seja, ela possui todas as caracterfsticas da escala ordinal 
mais o fator de que a distancia entre as diversas categorias (ou valores) e sempre constante. As escalas 
de medir temperaturas como a Fahrenheit e a Celsius sao exemplos de escalas de intervalo. No entanto, 
nao se pode afirmar que uma temperatura de 40 graus e duas vezes mais quente que uma de 20 graus, 
embora se possa dizer que a diferenga entre 20 graus e 40 graus e a mesma que entre 75 graus e 95 
graus. Isto porque este tipo de escala nao possui um zero absoluto. Ou seja o valor zero na escala e 
apenas um ponto de referencia e nao significa a ausencia de calor. Escores padronizados sao tambem 
exemplos deste tipo de nfvel de medida. 

Torna-se evidente que uma escala de intervalo requer o estabelecimento de algum tipo de 
unidade ffsica a qual todos concordem, isto e, um padrao, e, que seja replicavel, isto e, possa ser 
aplicada muitas vezes e fomecendo sempre os mesmos resultados. Comprimento e medido em termos 
de cm ou metros, tempo em segundos, temperatura em centfgrados ou Fahrenheit, renda em dolar ou 
reais. Por outro lado nao existem tais unidades para inteligencia, autoritarismo ou prestfgio que sejam 
unanimes entre todos os cientistas sociais e que possam ser assumidas constantes de uma situagao para 
outra. 

Nivel de razao. Este e o mais alto nfvel de medida. E caracterizado por apresentar todas as 
caracterfsticas da escala intervalar mais um zero absoluto. Aqui o zero pode ser entendido como a 
ausencia da caracterfstica e as comparagoes de valor (razao) tern sentido. Um exemplo de variavel 
deste tipo e o peso. Um valor igual a zero significa ausencia de peso e um valor de 20 kg e duas vezes 
mais pesado que um de 10 kg. 
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2. RESUMO DE PEQUENOS CONJUNTOS DE DADOS 

2.1. INTRODUgAO 


Para se analisar um conjunto de valores e necessario primeiramente, para fins de notagao, 
distinguir se este conjunto e resultado de um censo ou de uma amostragem. 

A Estatistica Descritiva pode ser estudada considerando os conjuntos de valores analisados 
como sendo amostras ou entao populagoes. Como o caso mais comum e a obtengao de amostras a 
notagao apresentada sera feita considerando os valores como resultados de amostragens. No entanto, 
convem ficar atento, com a bibliografia, pois dependendo do autor a orientagao pode ser outra. A 
diferenga, considerada do ponto de vista da descrigao dos dados, e apenas notacional. Assim o tamanho 
de uma populagao (quando finita) e representado, normalmente por “N”, enquanto que o tamanho de 
amostra e representado por “n”. Afora algumas excegoes os valores calculados na amostra sao 
representados por letras latinas enquanto que os correspondentes na populagao o sao pelas mesmas 
letras so que gregas. 

Para facilitar o estudo da Estatistica Descritiva os conjuntos de valores serao considerados 
como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a analise sera feita sem o 
agrupamento. Caso o conjunto tenha mais do que 30 valores entao primeiramente sera feito o 
agrupamento de acordo com o tipo de variavel considerada. O valor 30 e apenas um ponto de 
referencia escolhido arbitrariamente e dependendo da situagao pode-se considerar o agrupamento com 
mais ou menos valores envolvidos. 

Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as seguintes 

medidas: 

1. Medidas de tendencia central ou posigao 

2. Medidas de dispersao ou variabilidade. 

3. Medidas de assimetria. 

4. Medidas de achatamento ou curtose. 


2.2. MEDIDAS DE POSigAO OU TENDENCIA CENTRAL 


Um conjunto de valores (amostra) sera representada por: Xi, X 2 , ..., X n , onde “n” e o numero 
de elementos do conjunto, isto e, o tamanho da amostra. 

2.2.1. As MEDIAS 

(a) A media aritmetica 

A media aritmetica do conjunto xi, x 2 , ..., x n e representada por x e calculada por: 


x = (Xi + x 2 +... + x n ) / n = X— 


n 


(b) A media geometrica 

A media geometrica dos valores positivos: xi, x 2 , ..., x n , e representada por m g e calculada por: 
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(c) A media harmonica 

A media harmonica dos valores positivos xi, x 2 , x n e representada por m h e calculada por: 

1 _ n n 

mh= l i T~ 1 i T“7T 

1 1 - .... H 1 1 - ... H — 

Xi X2 Xn Xi X2 Xn Xi 

n 

Observando a expressao do calculo da media harmonica pode-se verificar que ela e definida 
como sendo: O inverso da media aritmetica dos inversos. 


Exemplo: 

Calcular as medias dos seguintes conjuntos de dados: 

(a) 19 (b) 4 6 (c) 1/2 4/5 3/2 7/4 


Para o conjunto em (a) tem-se: 

x = (1 + 9) / 2 = 5 m g = Vh9 = V9 = 3 m h = 2/ (1 + 1/9)= 18/10= 1,80 
Para o conjunto em (b) tem-se: 

X = (4 + 6) / 2 = 5 m g = V46 = a/ 24 = 4, 90 m h = 2 / (1/4 + 1/6) = 24/5 = 4,80 
Para o conjunto em (c) tem-se: 


X = [1/2 + 4/5 + 3/2 + 7/4] / 4 = 91/80 = 1,14 m g = 4 = 4 — = 1,02 


14 3 7 


84 


2 5 2 4 


'80 


m h = 


336 


2 5 2 4 377 377 

1 1 1 

1 4 3 7 84 


0,89 


Rela^ao entre as tres medias 

As tres medias mantem a seguinte rela§ao entre elas, desde que os valores sejam positivos e 
diferentes entre si. 

x > m g > m h 

(d) A media quadratica 

A media geometrica dos valores positivos: xi, x 2 , ..., x n , e representada por m q e calculada por: 

Ixf 


m q = 


2, 2 , ,2 
Xi +X2 + -+X n 


n 


(e) A media aritmetica ponderada 

A media aritmetica ponderada do conjunto xi, x 2 , Xk, com pesos wi, w 2 , ..., Wk, e 
representada por ma p e calculada por: 

ma p = (xi wi + x 2 w 2 +... + x n w k ) / (wi + w 2 + ...+ w k ) = ~f iWi 

L Wi 


(f) A media geometrica ponderada 

A media geometrica ponderada do conjunto xi, x 2 , ..., x k , com pesos wi, w 2 , ..., w k , e 
representada por mg p e calculada por: 
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mg p 



(g) A media harmonica ponderada 

A media harmonica ponderada do conjunto xi, x 2 , x k , com pesos wi, w 2 , w k , e 
representada por mh p e calculada por: 


mh p = ^ 



A media da primeira prova de Estatistica da turma 135 foi de 6,0 e foi realizada por 55 alunos. 
Na segunda prova compareceram 50 alunos que tiveram uma media de 6,5. A terceira prova realizada 
por 40 alunos teve media de 5,5. Qual a media aritmetica geral das 3 provas? 


mp = ^ XiWi = (6,0.55 + 6,5.50 + 5,5.40) / (55 + 50 + 40) = 875 / 145 = 6,03. 


2.2.2. A MEDIANA 

A mediana de um conjunto ordenado de valores, anotada por m e , e definida como sendo o 
valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se “n” (numero de 
elementos) e impar a mediana e o valor central do conjunto. Caso contrario a mediana e a media dos 
valores centrais do conjunto. Tem-se: 



Exemplo : 

Para o conjunto: 

15 18 21 32 45 46 49 

A mediana e: 

IHe = X( 7 +i )/2 = X 4 = 32, 

Ou seja, a mediana e o quarto valor na seqiiencia ordenada de elementos. 

Se o conjunto acima fosse: 

15 18 21 32 45 46 

Entao a mediana seria: 

me = [x (n /2) + X( n/2 )+i] / 2 = [x (6 / 2 ) + x (6 / 2 )+i] / 2 = (x 3 + x 4 ) / 2 = (21 + 32) / 2 = 53/2 = 26,50 

2.2.3. A MODA 

A moda de um conjunto de valores, anotada por m 0 , e definida como sendo “o valor (ou os 
valores) do conjunto que mais se repele’'. Convem lembrar que a moda ao contrario da mediana e da 
media pode nao ser unica, isto e, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem 
moda). Se a moda existir sera representada por nv 

Exemplo : 

Dado o conjunto: 


1223 344479 15 
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A moda sera: 
mo = 4, 

Pois este valor se repete 3 vezes no conjunto e qualquer outro se repete duas ou menos vezes. 

2.3. MEDIDAS DE VARIABILIDADE OU DISPERSAO 

2.3.1. A AMPLITUDE 

A mais simples das medidas de dispersao e a amplitude, anotada por “h”, e definida como 
sendo a diferenga entre os valores extremos do conjunto, isto e: 

h X max - Xjjjjn 

Exemplo: 

A amplitude do conjunto: 

-5 4 0 3 8 10, vale: 

h — x max - Xjjyjj = 10 - (-5) = 15. 

2.3.2. O DESVIO MEDIO (ABSOLUTO) 

A amplitude e uma medida simples e facil de calcular. Tern a virtude de dar uma ideia da 
variabilidade do conjunto. No entanto ela nao leva em consideragao todos os valores do conjunto como 
seria desejavel. 

Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informagao dispomvel. 
Uma destas medidas e o desvio medio absoluto ou simplesmente desvio medio. O desvio medio e 
representado por “dma” e definido como sendo “a media das distancias que os valores do conjunto se 
encontram da media”. 

dma = [ Ixi - xl + lx 2 - xl + ... + lx n - xl ] / n = — — 

n 

Exemplo: 

Calcular o dma do conjunto: 

-7 4 0 3 8 10 

A media eX=(-7 + 4 + 0 + 3 + 8 + 10)/6 = 18/6 = 3 
Entao o desvio medio sera: 

dma = [1-7 - 31 + 14 - 31 + 10 - 31 + 13 - 31 + 18 - 31 + 110 - 31] / 6 = (10 + 1 + 3 + 0 + 5 + 7) / 6 = 
26/6 = 4,33 

2.3.3. A VARIANCIA 

O desvio medio apesar de intuitivamente facil de interpretar e simples de calcular nao e muito 
utilizado em Estatistica. O que de fato e a medida de dispersao usual e a variancia e principalmente sua 
raiz quadrada que e denominada de desvio padrao. A variancia e anotada por s 2 e definida como sendo 
“a media dos quadrados dos desvios em relagao a media aritmetica.” Por desvio entende-se a 
diferenga entre um valor do conjunto e a media. 
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s 2 = [(Xi - x) 2 + (x 2 - x) 2 + ... + (x n - x) 2 ] / n = I ^ Xl 

n 

Nem sempre esta expressao e a mais indicada para ser utilizada. Quando a media e um valor 
decimal nao exato ela nao e muito pratica, uma vez que entrara no calculo “n” vezes aumentando os 
erros de arredondamento que ocorrem. Neste caso e melhor se valer de uma expressao alternativa que 
pode ser derivada da expressao acima desenvolvendo o quadrado dentro do somatorio e fazendo 
algumas simplifica§oes. 

Trabalhando inicialmente apenas com o numerador da formula acima vem: 

I( Xi -x) 2 = Z(xi 2_2 XiX + x 2 ) = Zx 2 - 2 x£xi-Zx 2 


Observando que x = X~ tem-se que: X Xi = nx e ainda que: X x^ = n vem: 


—2 2 


n 


X(xi-x) - Xxf-2n x 2 + nx 2 = Xxf- n ; 


Dividindo este resultado por “n” e simplificando a segunda parcela vem: 


— x2 


„2 y" (xi x) y Xi — 2 

s - X X x 

n n 


Esta e uma segunda expressao para o calculo da variancia e em muitas situa?oes e mais 
vantajosa de ser usada. Neste caso a variancia pode ser caracterizada como sendo: “ a media dos 
quadrados menos o quadrado da media”. 


2.3.4. O DESVIO PADRAO 


A variancia por ser um quadrado nao permite compara§oes com a unidade que se esta 
trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a 
raiz quadrada da variancia, que e denominada de desvio padrao. Assim a expressao para o desvio e: 




(x;-x) 2 


n 



Exeniplo: 

Calcular a variancia e o desvio padrao do conjunto: 

-7 4 0 3 8 10 

A media e X = (-7 + 4 + 0 + 3 + 8 + 10) / 6 = 18/6 = 3 
Entao variancia sera: 

S 2 = [(-7 - 3) 2 + (4 - 3) 2 + (0 - 3) 2 + (3 - 3) 2 + (8 - 3) 2 + (10 - 3) 2 ] / 6 = 

= (100 + 1 + 9 + 0 + 25 + 49) / 6 = 184 / 6 = 30,67 
E o desvio padrao: S = 5,54 

2.3.5. A VARIANCIA RELATIVA 

A variancia relativa, representada por g 2 eo quociente entre a variancia absoluta e o quadrado 
da media. Isto e: 

g = S / X 
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2.3.6. O COEFICIENTE DE VARIA^AO 

O coeficiente de variagao e a raiz quadrada da variancia relativa. Isto e: g = S / X 

Exemplo : 

Calcular a variancia relativa e o coeficiente de variagao do conjunto: 

-7 4 0 3 8 10 

A media e x = (-7 + 4 + 0 + 3 + 8 + 10)/ 6 = 18/6 = 3 
Entao variancia sera: 

S 2 = [(-7 - 3) 2 + (4 - 3) 2 + (0 - 3) 2 + (3 - 3) 2 + (8 - 3) 2 + (10 - 3) 2 ] / 6 = 

= (100 + 1 + 9 + 0 + 25 + 49) / 6 = 184 / 6 = 30,67 
O desvio padrao sera: S = 5,54 
Entao a variancia relativa sera: 
g 2 = (184/6) / 9 = 3,41 

E o coeficiente de variagao sera: g = S / X = 5,54 / 3 = 184,59% 


Prof. Lori Viali, Dr. 


viali@mat.pucrs.br - http ://www. mat. pucrs.br/~lori/ 


13 




SERIE: Estatistica Basica 


Texto 1 : DESCRITIV A 


3. DISTRIBUTEES DE FREQUENCIAS 


3.1. INTRODUgAO 

Para se trabalhar com grandes conjuntos de dados e necessario inicialmente agrupar estes 
dados. O agrupamento e feito em tabelas, denominadas de distributes de frequencias. Para se 
construir uma distribuigao de frequencias e comum fazer a distingao entre dois tipos de variaveis. A 
variavel (ou conjunto) discreta (valores que sao resultados de contagem) e a variavel (ou conjunto) 
contmua (valores que sao resultados de uma medida). Em geral variaveis discretas sao agrupadas em 
distributes por ponto ou valores e variaveis contmuas em distributes por classes ou intervalos. 
A separagao nao e rfgida e depende basicamente dos dados considerados. Podera ser necessario usar 
uma distribuigao por classes ou intervalos mesmo quando a variavel e discreta. 


3.2. DISTRIBUTEES POR PONTO OU VALORES. 


Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, 
o numero de irmaos dos alunos da turma U, disciplina de Estatistica. 


Numero de irmaos dos alunos da turma U - disciplina Estatistica 


0 1 

1 

6 

3 1 

3 

1 

1 

4 5 

1 

1 

1 0 

2 

2 

4 

3 1 

2 

1 

1 1 

1 

5 

5 

4 1 

1 

0 

2 1 

4 

3 

2 

1 0 

2 

1 

1 2 

3 

0 

1 


0 

1 
6 

2 
0 


Esta colegao de valores nao constitui informagao mas pode ser transformada em informagao 
mediante sua representagao em uma distribuigao de frequencias por pontos ou valores. Para tal, coloca- 
se o conjunto em uma tabela em que a coluna da esquerda e representada pelos diferentes numeros 
ordenados (os pontos ou valores) e a coluna da direita pelo numero de vezes que cada valor se repetiu 
(as frequencias simples ou absolutas). Para o exemplo, na tabela tres, tem-se: 

Tabela 03 - Distribuigao de freqtiencias por ponto ou valores do numero de irmaos dos 
alunos da turma U. Disciplina Estatistica. 


Numero de irmaos 

Numero de alunos 

0 

7 

1 

21 

2 

8 

3 

5 

4 

4 

5 

3 

6 

2 

Total 

50 


3.3. DISTRIBUigOES POR CLASSES OU INTERVALOS 

Considere-se um conjunto de valores resultados de uma medida. Poderia ser, por exemplo, a 
idade dos alunos da turma U da disciplina de Estatistica. 
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Idade (em meses) dos alunos da turma U - Disciplina Estatistica 


230 

234 

276 

245 

345 

240 

270 

310 

368 

369 

334 

268 

288 

336 

299 

236 

239 

355 

330 

247 

287 

344 

300 

244 

303 

248 

251 

265 

246 

266 

240 

320 

308 

299 

312 

324 

289 

320 

264 

275 

252 

298 

315 

255 

274 

264 

263 

230 

303 

281 


Este conjunto de valores, obviamente nao pode ser apresentado da mesma forma que o 
anterior, pois quase nao ha repeti§oes. Neste caso e necessario construir uma tabela denominada de 
’’distribuigao de freqiiencias por classes ou intervalos”. Evidentemente havera perda de informagao 
neste processo, mas o ganho obtido pela facilidade compreensao dos dados compensa. 

O procedimento para construir esta distribuigao envolve os seguintes passos (algoritmo): 

S Determinar a amplitude dos dados: h = X max - x m j n . 

■S Decidir sobre o numero de classes “k“ a ser utilizado. Recomenda-se um numero de 
classes entre 5 e 15. Para que a decisao nao seja totalmente arbitraria pode-se usar a raiz 

quadrada do numero de valores como o numero de classes, ou seja, k = Vn . 

■S Determinar a amplitude de cada classe. Sempre que possfvel manter todas as amplitudes 
iguais. Para tanto deve-se dividir a amplitude dos dados “h” pelo numero de classes “k”, 

arredondando para mais, ou seja, hi = h / k. 

■S Contar o numero de valores pertencentes a cada classe. Em geral, utiliza-se a simbologia 
(I — ), para indicar um intervalo fechado a esquerda e aberto a direita. Tambem poderia ser 
utilizado o intervalo aberto a esquerda e fechado a direita ( — I), aberto de ambos os lados 
( — ) ou ainda fechado de ambos os lados (I — I). 

Um exemplo de uma distribuigao por classes ou intervalos e apresentado na tabela 04. 

Tabela 04 - Idades dos alunos da turma U - Disciplina Estatistica. 


Idades 

Numero de alunos 

230 1 — 250 

12 

250 1 — 270 

9 

270 1 — 290 

8 

290 1 — 310 

7 

3101 — 330 

6 

330 1 — 350 

5 

350 1 — 370 

3 

Total 

50 


3.4. ELEMENTOS DE UMA DISTRIBUIQAO DE FREQUENCIAS 

Alem da freqiiencia simples ou absoluta pode-se definir ainda: 

3.4.1. A FREQUENCIA RELATIVA OU PERCENTUAL 

A freqtiencia relativa simples ou percentual e definida como sendo o quociente entre a 
freqtiencia simples “fj” e o total de dados “n”. 

ffi = fj / n 
Exemplo: 
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Na tabela tres tem-se: 

&3 = 8 / 50 = 0,16 = 16%, significando que 16% dos alunos da turma possuem 2 irmaos. 
Na tabela quatro tem-se: 

fr2 = 9 / 50 = 0,18 = 18%, significando que 18% dos alunos possuem idades maiores ou 
iguais a 250 meses porem menores do que 270 meses. 

3.4.2. A FREQUENCIA ACUMULADA SIMPLES OU ABSOLUTA. 

A freqtiencia acumulada simples ou absoluta da linha “i” e definida como sendo a soma das 
freqliencia simples ou absolutas ate a linha “i 

Fj = f| + f2+ ••• + fi 

Exemplo: 

Na tabela tres tem-se: 

F4 = fi + f2 + f3 + f4 = 7 + 21 + 8 + 5 = 41, significando que 41 alunos da turma possuem ate 3 
irmaos. 

3.4.3. A FREQUENCIA ACUMULADA RELATIVA OU PERCENTUAL 

A freqiiencia acumulada relativa ou percentual da linha “i” e definida como sendo a soma das 
freqiiencia relativas ou percentuais ate a linha “i 

Fi'j = fri + &2 + ... + fi'j , ou entao, como sendo o quociente da freqiiencia acumulada simples 
pelo total de dados. 

Fr ; = F; / n 

Exemplo: 

Na tabela quatro tem-se: 

Fr2 = (12 + 9) / 50 = 42%, isto e, 42% dos alunos possuem idades menores do que 270 meses. 

3.4.4. OUTROS ELEMENTOS 

(i) Na tabela tres os valores da coluna da esquerda sao denominados de pontos ou valores. 
Cada um deles e representado por Xi , onde “i” varia de 1 ate k, sendo “k” o numero de linhas da 
tabela. 

(ii) Na tabela quatro os valores da coluna da esquerda sao denominados de classes ou 
intervalos. As classes, tambem, variam de 1 ate k. 

(iii) Limite inferior da classe “i“. Anota-se por lij. 

Na tabela 4 o limite inferior da terceira classe e: 270. 

(iv) Limite superior da classe “i“. 

Anota-se por Is*. Na tabela 4 o limite superior da quinta classe e: 330. 

(v) Amplitude da classe “i”. Anota-se por hi e e calculada como a diferen§a entre os limites 
superior ou inferior da classe “i”. Assim hi = Is; - li|. 

Na tabela quatro a amplitude da classe quatro e: Iq = IS4 - I 14 = = 310 - 290 = 20 meses. 

(vi) Ponto medio da classe. Como nao e possfvel trabalhar com classes e necessario escolher 
um representante da classe. Este representante e denominado de ponto medio da classe. E representado 
por Xi e calculado por: xj = (lii + lsi) / 2 ou entao x, = lit + hi / 2. 
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Na tabela quatro o ponto medio da terceira classe e: X 3 = (lq + IS 3 ) / 2 = (270 + 290) / 2 = 280 

meses. 

Exemplo : 

Na tabela 05, abaixo, estao ilustrados os calculos das freqiiencias relativas percentuais, da 
freqiiencia acumulada simples e da freqiiencia acumulada percentual. 


Tabela 05 - Exemplos de freqiiencias 


Numero de irmaos 

Numero de alunos 

fn 

Fi 

Fr s 

0 

7 

14 

7 

14 

1 

21 

42 

28 

56 

2 

8 

16 

36 

72 

3 

5 

10 

41 

82 

4 

4 

8 

45 

90 

5 

3 

6 

48 

96 

6 

2 

4 

50 

100 

Total 

50 

100 

— 

— 


3.5. APRESENTA^AO DE UMA DISTRIBUigAO DE FREQUENCIAS 

3.5.1. DlSTRIBUIQAO DE FREQUENCIAS POR PONTOS OU VALORES. 

Uma distribuigao de freqiiencias por pontos ou valores e apresentada graficamente atraves de 
um diagrama de linhas ou colunas, onde a variavel “x” e representada no eixo das abcissas (horizontal) 
e as freqiiencias (que podem ser de qualquer tipo) no eixo das ordenadas (vertical). Veja-se um 
exemplo de diagrama de colunas simples na figura 01 . 

Figura 01 - Diagrama de colunas simples da variavel "numero de irmaos dos alunos da 
turma U - Disciplina de Estatistica" 



3.5.2. DlSTRIBUIQAO DE FREQUENCIAS por classes ou intervalos 

Uma distribuigao de freqiiencias por classes ou intervalos e apresentada graficamente atraves 
de um diagrama denominado de histograma. Um histograma e um grafico de retangulos justapostos 
onde a base de cada retangulo e a amplitude de cada classe e a altura e proporcional a freqiiencia 
(simples ou relativa) de modo que a area de cada retangulo seja igual a freqiiencia considerada. Desta 
forma a altura de cada retangulo sera igual a: f / hi ou entao fq / Iq. Veja-se o calculo das alturas na 
tabela 06 e o exemplo na figura 02. Tambem pode ser construido um histograma utilizando-se as 
freqiiencias acumuladas. Neste caso o diagrama resultante e denominado de ogiva. Se os pontos 
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medios de cada classe de um histograma forem unidos atraves de segmentos de retas teremos entao um 
diagrama denominado de poligono de frequencias. 


Tabela 06 - Calculo das ordenadas do histograma 


Idades 

Numero de alunos 

fi/hi 

230 1 — 250 

12 

0,60 

250 1 — 270 

9 

0,45 

270 1 — 290 

8 

0,40 

290 1 — 310 

7 

0,35 

3101 — 330 

6 

0,30 

330 1 — 350 

5 

0,25 

350 1 — 370 

3 

0,15 

Total 

50 

— 


Figura 02 - Histograma de freqiiencia simples da variavel "idades dos alunos da turma 
U - Disciplina de Estatistica" 


□ fi/hi 



3.6. RESUMO DE UMA DISTRIBUIQAO DE FREQUENCIAS 
3.6.1. Medidas DE POSICAO OU TENDENCIA central 
(i) A media aritmetica 

A media aritmetica de uma distribuigao de frequencias por pontos ou valores ou ainda por 
classes ou intervalos e dada por: 

X = (fiXi + f 2 X 2 +••• + fn x n) / (fl + U + ••• + fn) = 

n 


Exemplqs : 

A media da distribuigao da tabela tres, utilizando a tabela 07 para fazer os calculos sera: 
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Tabela 07 - Calculo da media de uma distribuigao por pontos ou valores 


Numero de irmaos 

Numero de alunos 

f iXi 

0 

7 

0 

1 

21 

21 

2 

8 

16 

3 

5 

15 

4 

4 

16 

5 

3 

15 

6 

2 

12 

Total 

50 

95 


X _ ^ fjJk = 95 / 50 = 1,90 irmaos. 
n 

Ou seja, o numero medio de alunos da turma U, de Estatistica, e de 1,90. 

Ja para a tabela quatro e necessario primeiro obter os valores dos pontos medios de cada 
classe ou intervalo. Fazendo os calculos na tabela 08, vem: 

Tabela 08 - Calculo da media de uma distribuigao por classes 


Idades 

Numero de alunos 

Xi 

fiX{ 

230 1 — 250 

12 

240 

2880 

250 1 — 270 

9 

260 

2340 

270 1 — 290 

8 

280 

2240 

290 1 — 310 

7 

300 

2100 

3101 — 330 

6 

320 

1920 

330 1 — 350 

5 

340 

1700 

350 1 — 370 

3 

360 

1080 

Total 

50 

— 

14260 


Deste modo a media das idades sera: 

X = = 14 260 / 50 = 285,20 meses, ou seja, 285 meses e 6 dias. 

n 

(ii) A mediana 

(a) A mediana de uma distribuigao de valores ou pontos e obtida da mesma forma que para 
dados nao agrupados, isto e: 

me = x (n+1) /2 se “n” e fmpar e m e = [x (n / 2 ) + x (n / 2 ) + i] / 2 se “n” e par 

Observagao: Neste caso deve-se trabalhar como se o conjunto nao estivesse agrupado. 

Exemplo : 

Para os valores da tabela tres a mediana e: 

me = [X50/2 + X(5o/2)+i] / 2 = [x 2 5 + x 2 6] / 2 = (1 + 1) / 2 = 1, pois da oitava posigao ate a 
vigesima oitava posigao todos os valores sao iguais a um, e a mediana e a media entre os valores que se 
encontra na vigesima quinta e vigesima sexta posigao. 
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(b) A mediana de uma distribuigao de freqiiencias por classes ou intervalos e dada pela 
seguinte expressao: 


IHe = 


lii + hi 



onde 


lii = limite inferior da classe mediana, isto e, a classe que contem o ou os valores centrais; 

hj = amplitude da classe mediana; 

fi = freqiiencia simples da classe mediana; 

Fi_i = freqiiencia acumulada simples da classe anterior a classe mediana. 


Exemplo ; 

Considerando que a classe mediana, na tabela quatro, e a que contem os valores X25 e X26, isto 
e, a terceira classe, vem: 


Hie — li 3 h3 


n/ _ 

VO F2 


= 270 + 20[(25 - 21) / 8] = 270 + 10 = 280 meses. 


(iii) A moda 

(a) A moda de uma distribuigao de valores ou pontos e obtida da mesma forma que para dados 
nao agrupados, ou seja, observando o valor ou os valores que mais se repetem. 

irg, = valor da linha com maior freqiiencia (se existir apenas uma). 


Exemplo: 

Para os valores da tabela tres a moda e: 


trio = 1, pois este valor com uma freqiiencia de 21 e o que mais se repete. 

(b) A moda de uma distribuigao de freqiiencias por classes ou intervalos e dada pelas 
seguintes expressoes: 


n\)= lii + hi 


f i+ i 

_fi-i + fi+i_ 


denominada de moda de King, ou 


m 0 = lii + hi 


fi ~ fi-i 

_2fi — fi-i — fi+i_ 


denominada de moda de Kzuber, onde: 


lii = limite inferior da classe modal, isto e, a classe de maior freqiiencia; 

hi = amplitude da classe modal; 

fi = freqiiencia simples da classe modal; 

fi_i = freqiiencia simples da classe anterior a classe modal; 

f i+1 = freqiiencia simples da classe superior a classe modal. 


Exemplo : 

Considerando que a classe de maior freqiiencia, a classe modal, na tabela quatro, e a primeira, 

vem: 
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m 0 = lii + hi 


[2 
f 2 


= 230 + 20 = 250 meses. 


m G = lh + hi 


fi 

2 f 1 f 2 


= 230 + 20[12 / (24 - 9)] = 230 + 16 = 246 meses. 


(iv) Rela^ao entre as tres medidas de posi^ao 

Karl Pearson estabeleceu a seguinte relagao aproximada entre as tres medidas de posigao: 

x - nio = 3 (x- me), 

Ou seja, em uma distribuigao de frequencias a diferenga entre a media e a moda e 3 vezes 
maior do que a diferenga entre a media e a mediana. 

3.6.2. Medidas de variabilidade ou dispersao 


(a) A amplitude 

A amplitude de uma distribuigao de frequencias e definida como sendo a diferenga entre os 
valores extremos da distribuigao, isto e: 

h = x max - x m j n . para a distribuigao por pontos ou valores e 

h = ls k - lii, para a distribuigao por classes ou intervalos. 

Exeniplo: 

A amplitude da distribuigao da tabela tres e: 

h = X max - Xmin = 6-0 = 6 irmaos 
Ja a amplitude da distribuigao da tabela quatro vale: 
h = IS7 - lii = 370 - 230 = 140 meses 

(b) O desvio medio (absoluto) 

O desvio medio absoluto de uma distribuigao de frequencias e dado por: 

dma = [ fjxi - xl + f 2 lx 2 - xl + ... + f k lx n - xl ] / n = — El 

n 

Exemplo : 

O dma da distribuigao da tabela tres utilizando a tabela 09 para os calculos, vale: 

Tabela 09 - Calculo dos desvio medio absoluto 
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dma = 


n 


= 64,40 / 50 = 1,29 irmaos 


(c) A variancia 

A variancia de uma distribuigao de freqiiencias pode ser avaliada por qualquer uma das 
expressoes abaixo. 


s 2 - [fi(xi - x) 2 + f 2 (x 2 - x) 2 + ... + f k (x k -x) 2 ] / n = X fl0(l 



—2 

“X 


(d) O desvio padrao 

O desvio padrao de uma distribuigao de freqiiencias e determinado extraindo-se a raiz 
quadrada da variancia. Assim, do desvio padrao e: 




fi(xi-x) 2 


n 


= aS 


fi X i _2 


Exemplo : 

A variancia e o desvio padrao da distribuigao da tabela 04, utilizando a tabela 10 para os 
calculos vale: 

Tabela 10 - Ilustragao do calculo da variancia 



A variancia da distribuigao sera: 
f 2 

S 2 = — X 2 = 4 138 000 / 50 - 285, 20 2 = 82760 - 81339,04 = 1420,96 

n 

O desvio padrao vale: 

S^S^-x 2 =37,70 

A variancia relativa: g 2 = S 2 / X 2 = 0,0175 
O coeficiente de variagao vale: g = s/ X = 0,1 32 2 = 13,22% 

3.6.3. Medidas de assimetria 

A assimetria de um conjunto de dados, agrupados ou nao, pode ser avaliada atraves da 
seguinte relagao devida a Karl Pearson: 
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ai = 3(x - me) / s 

Se ai for igual a zero entao a distribuigao (ou conjunto) e dito simetrico. Se ai > 0 entao a 
assimetria e positiva significando que o grafico da distribuigao tern uma cauda alongada a direita. Caso 
ai seja negativo a cauda do grafico sera alongada a esquerda. 

Se uma distribuigao de freqtiencias e simetrica entao as 3 medidas de posigao coincidem, isto 
e: 

x = m e = m 0 . 

Se a distribuigao e positivamente assimetrica entao X > me > mo 

E se a distribuigao e negativamente assimetrica entao X < nr* < me 


3.7. PROPRIEDADES DAS MEDIDAS 

3.7.1. Medidas de posigAo 

(i) Se todos os valores de um conjunto de dados forem somados a uma constante entao as 
medidas de posigao aumentam desta constante. Em sfmbolos. Dado um conjunto de dados x e somando 
a este conjunto uma constante “c”. Entao para y = x + C, tem-se: 

y = x + c 

O mesmo acontece com a mediana e a moda. 

(ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante entao 
as medidas de posigao ficam multiplicadas por esta constante. Em sfmbolos. Se um conjunto de dados 
x for multiplicado por uma constante “c”. Entao para y = cx, tem-se: 

y = cx 

O mesmo acontece com a mediana e a moda. 

3.7.2. Medidas de dispersao 

(i) Se todos os valores de um conjunto de dados forem somados a uma constante entao as 
medidas de dispersao nao se alteram. Em sfmbolos. Dado um conjunto de dados x e somando a este 
conjunto uma constante “c”. Entao para y = x + C, tem-se: 

Sy = S X 

O mesmo vale para a variancia e para o dma. O coeficiente de variagao e a variancia relativa 
sao excegoes, pois sao medidas derivadas, que combinam uma medida de posigao a media no 
denominador que se altera e uma medida de dispersao o desvio padrao ou a variancia no numerador 
que nao se altera. 

(ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante entao 
as medidas de posigao ficam multiplicadas por esta constante, sendo que a variancia fica multiplicada 
pelo quadrado desta constante. Em sfmbolos. Se um conjunto de dados x for multiplicado por uma 
constante “c”. Entao para y = cx, tem-se: 

Sy = CS X 

O mesmo vale para a o dma. Ja a variancia que e um quadrado fica multiplicada pelo 
quadrado da constante. O coeficiente de variagao e a variancia relativa sao excegoes, pois sao medidas 
derivadas, que combinam uma medida de posigao, a media no denominador que se altera, e uma 
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medida de dispersao, o desvio padrao ou a variancia no numerador, que tambem se altera. Como tanto 
o numerador quanto o denominador se alteram na mesma propor§ao, entao a razao entre as duas 
alteragoes passara a ser um. Portanto tanto a variancia relativa quanto o coeficiente de variagao sao 
indiferentes a uma multiplica§ao do conjunto de valores por uma constante. 
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4. EXERCICIOS 

1. Identifique os tipos de escalas utilizadas para cada uma das seguintes caracterfsticas das unidades de 
observagao, retiradas de uma tabela do Guia do Usuario do aplicativo Microsoft Excel: mes, tipo de 
produto, vendedor, regiao do pais, unidades vendidas e total de vendas. 

2. E possfvel encontrar a seguinte serie de desvios tornados em relagao a media aritmetica: 4, -3, 2, -7 e 
5? Justifique. 

3. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se o 
peso medio do grupo A for de 80 kg e o do grupo B for de 70 kg entao e verdade que o peso medio 
dos dois grupos considerados em conjunto e de 75 kg? Justifique. 

4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as medias: 70, 65 e 45, 
obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a media geral do concurso? 

5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma media de 70 
pontos em determinada prova. Sabendo-se que a media geral dos candidatos (independente de sexo) 
foi de 64 pontos, qual foi a media dos candidatos do sexo feminino? 

6 . Determinar a moda dos seguintes conjuntos: 

(6.1) 1,6, 9, 3, 2,7,4 e 11 

(6.2) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5 

(6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10 

(6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18 

7. Determinar a mediana dos seguintes conjuntos: 

(7.1) 9 14 2 8 7 14 3 21 1 

(7.2) 0,02 0,25 0,47 0,01 -0,30 -0.5 

(7.3) 1/2 3/4 4/7 5/4 -2/3 -4/5 -1/5 3/8 

8 . Para os conjuntos abaixo, determinar com aproximagao centesimal, as seguintes medidas: 

(a) A amplitude (b) O desvio medio (c) A variancia (d) O desvio padrao (e) O coeficiente de 
variagao. 

(8.1) 0,04 0,18 0,45 1,29 2.35 

(8.2) -7/4 -1/3 3/5 7/20 1 4/3 

9. Dados os seguintes conjuntos de valores: 

(a) 1 3 7 9 10 (b) 20 60 140 180 200 (c) 10 50 130 170 190. 

Calculando a media e o desvio padrao do conjunto em (a), determinar, atraves das propriedades, a 
media e o desvio padrao dos conjuntos em (b) e (c). 

10. Quarenta alunos da PUC foram questionados quanto ao numero de livros lidos no ano anterior. 


Foram registrados 

4 2 

os seguintes valores: 

10 3 1 

2 

0 

2 

1 

0 2 

110 4 

3 

2 

3 

5 

8 0 

16 5 3 

2 

1 

6 

4 

3 4 

3 2 10 

2 

1 

0 

3 

(10.1) Organize os dados em uma tabela adequada. 

(10.2) Qual o percentual de alunos que leram menos do que 3 livros. 


(10.3) Qual o percentual de alunos que leram 4 ou mais livros. 
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( 10 . 4 ) Classifique a variavel e o tipo de distribuigao utilizada. 

11 . O conjunto de dados abaixo representa uma amostra de 40 elementos: 


3,67 

1,82 

3,73 

4,10 

4,30 

1,28 

8,14 

2,43 

4,17 

2,88 

5,36 

3,96 

6,54 

5,84 

7,35 

3,63 

2,93 

2,82 

8,45 

4,15 

5,28 

5,41 

7,77 

4,65 

1,88 

2,12 

4,26 

2,78 

5,54 

6,00 

0,90 

5,09 

4,07 

8,67 

0,90 

6,67 

8,96 

4,00 

2,00 

2,01 


( 11 . 1 ) Agrupe os dados em uma distribuigao de freqtiencias, considerando o limite inferior igual a 
zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude. 

( 11 . 2 ) Construa um histograma de freqtiencias relativas. 

( 11 . 3 ) Una os pontos medios de cada retangulo, obtendo o polfgono de freqiiencias relativas e 
classifique o conjunto quanto a assimetria. 

12 . A tabela registra simultaneamente 200 alugueis de imoveis urbanos e 100 de imoveis rurais. 

( 12 . 1 ) Calcule e interprete fr 2 para cada caso. 

( 12 . 2 ) Calcule e interprete F 3 para cada caso. 

( 12 . 3 ) Calcule e interprete Fr 4 - Fr 2 para cada caso. 

13 . O histograma abaixo representa os salarios, em 
unidades monetarias (u.m.) dos 100 empregados de 
uma empresa: 

( 13 . 1 ) Que percentual de empregados recebem 8 
u.m. ou mais? 

( 13 . 2 ) Quantos empregados recebem de 4 a 16 u.m.? 

( 13 . 3 ) Quantos empregados recebem menos que 4 u.m. ou mais que 12 u.m.? 

0,09 
0,08 
0,07 
0,06 
0,05 
0,04 
0,03-1 
0,02 - 
0 , 01 - 

0-1 

0 |— 4 4 I- 8 8 I- 12 12|-16 

14 . Um livro com 50 paginas apresentou um numero 
tabela: 

( 14 . 1 ) Qual o numero medio de erros por pagina? 

( 14 . 2 ) Qual o numero mediano de erros por pagina? 

( 14 . 3 ) Qual o numero modal de erros por pagina? 

( 14 . 4 ) Qual o desvio padrao do numero de erros por 


16 |-20 


de erros de impressao por pagina conforme 


pagina? 


Erros 

Numero de paginas 

0 

” 25 

1 

20 

2 

3 

3 

1 

4 

1 

Total 

50 


□ fri/hi | 


Alugueis 

Zona Urbana 

Zona Rural 

1 1- — 3 

10 

30 

3 1- — 5 

40 

50 

5 1- — 7 

80 

15 

7 1- — 9 

50 

05 

9 1- — 11 

20 

00 

1 

200 

100 
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15 . Durante certo perfodo de tempo o rendimento de 10 agoes foram os que a 
tabela registra. 

( 15 . 1 ) Calcule o rendimento medio. 

( 15 . 2 ) Calcule o rendimento mediano. 

( 15 . 3 ) Calcule o rendimento modal. 

( 15 . 4 ) Calcule o desvio padrao do rendimento. 

( 15 . 5 ) Calcule o coeficiente de variagao do rendimento. 

16 . Uma regiao metropolitana tern 50 quarteiroes com os seguintes numeros de 
casas por quarteirao: 


A^ao 

Taxa (%) 

1 

2,59 

2 

2,64 

3 

2,60 

4 

2,62 

5 

2,57 

6 

2,55 

7 

2,61 

8 

2,50 

9 

2,63 

10 

2,64 


2 

2 

3 

10 

13 

14 

15 

15 

16 

16 

18 

18 

20 

21 

22 

22 

23 

23 

25 

25 

26 

27 

29 

29 

30 

32 

36 

42 

44 

45 

45 

46 

48 

52 

58 

59 

61 

61 

61 

65 

66 

66 

68 

75 

78 

80 

89 

90 

92 

97 


( 16 . 1 ) Construa, com os dados, uma distribuigao de freqliencias por intervalos fazendo com que as 
classes tenham amplitudes igual a 14. 

( 16 . 2 ) Calcule o numero medio de casas por quarteirao. 

( 16 . 3 ) Determine o numero mediano de casas por quarteirao. 

( 16 . 4 ) Calcule a variancia do numero de casas por quarteirao. 

( 16 . 5 ) Calcule, pelos dois processos, o numero modal de casas por quarteirao. 


17 . De um levantamento feito entre 100 famflias resultou a tabela ao lado. Determine: 

( 17 . 1 ) O numero medio de filhos. 

( 17 . 2 ) O numero mediano de filhos. 

( 17 . 3 ) O numero modal de filhos. 

( 17 . 4 ) O desvio padrao do numero de filhos. 

18 . As informagoes abaixo dizem respeito a distribuigao 
de tres variaveis. Indique, justificando, qual delas tern 
media mais representativa. 

Distribuigao A Distribuigao B 


Numero de filhos 

Numero de famflias 

0 


1 

23 

2 

28 

3 

21 

4 

7 

5 

3 

Total 

100 


Distribuigao C 


n = 200 
Ifx = 5000 
Ifx 2 = 130000 


n = 50 
Ifx = 500 
Ifx 2 = 5450 


x =8 

Ifx = 3200 
Ifx 2 = 32000 


19 . 


Identifique, justificando, qual a variavel mais homogenea. 
Distribuigao A Distribuigao B 


n= 100 
Ifx = 5000 
Ifx 2 = 256400 


x = 50 
Ifx = 10000 
If(x- x) 2 = 7200 


20 . Uma variavel x tern media igual a 10 e variancia igual a 16. Calcule a media e a variancia da 
variavel dada por y = (3x + 5) / 2 
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21. Uma variavel x tem media igual a 5 e desvio padrao igual a 3. Calcule o coeficiente de variagao da 
variavel y = 4x + 4 

22. Uma variavel x tem media igual a 6 e coeficiente de variagao igual a 0,50. Calcule o coeficiente de 
variagao da variavel y = (5x - 2) / 2 

23. Os operarios de um setor industrial tem, em uma epoca 1, um salario medio de 5 salarios mfnimos 
(sm) e desvio padrao de 2 sm. Um acordo coletivo preve, para uma epoca 2, um aumento linear de 
60%, mais uma parte fixa correspondente a 70% de um salario mmimo. Calcule a media e o 
desvio padrao dos salarios na epoca 2. 

24. Uma variavel x assume valores no intervalo [10; 30]. 

(23.1) Sabendo que x tem uma distribuigao assimetrica positiva voce diria que a media de x e: 20, 
menor que 20 ou maior que 20. Justifique. 

(23.2) E se x tiver uma distribuigao simetrica? 

25. O que se pode dizer se fosse dada a informagao de que o salario mediano de um conjunto de 
profissionais e de 6 sm? 

26. Um a comunidade A tem 100 motoristas profissionais cujo salario medio e de 5 sm. A comunidade 
B, com 300 desses profissionais, remunera-os com uma media de 4 sm. 

(25.1) E correto afirmar que A remunera melhor seus motoristas profissionais que B? 

(25.2) Diante das informagoes disponfveis ha garantia que os 100 salarios individuais de A sao 
maiores que os 300 de B? Por que? 

27. Abaixo voce encontra duas distribuigoes que refletem os comportamentos de x e y (tamanhos de 
famflias) em duas comunidades, sendo que uma de base cultural alema e outra italiana. Utilize tais 
informagoes para uma analise que indique qual das duas comunidades tem famflias maiores. 


28. O departamento de pessoal de um certa firma fez um levantamento dos salarios dos 120 
funcionarios do setor administrative, obtendo os resultados da tabela: 

(28.1) Determine o salario medio dos funcionarios 

(28.2) Determinar a variancia e o desvio padrao dos salarios. 

(28.3) Determinar o salario mediano. 

(28.4) Determinar o salario modal pelos criterios de King e Czuber. 

(28.5) Se for dado um aumento de 20% para todos os funcionarios, qual sera o novo salario medio 
e o novo desvio padrao dos salarios? 

(28.6) Se for dado um abono de 0,5 s.m. a todos os 
funcionarios como fica a media e o desvio padrao dos 
salarios? 

29. O que acontece com a media e o desvio padrao de um 
conjunto de dados quando: 


Faixa salarial (s.m.) 

% de funcionarios 

1 1 — 3 

0,25 

3 1 — 5 

0,40 

5 1 — 7 

0,20 

7 1— 10 

0,15 

Total 

1,00 


Y 

f 

3 

48 

4 

51 

5 

48 

6 

41 

7 

32 

8 

14 

9 

6 


X 

f 

2 

25 

3 

30 

4 

48 

5 

111 

6 

98 

7 

88 
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( 29 . 1 ) Cada valor e multiplicado por 2. 

( 29 . 2 ) Soma-se o valor 10 a cada valor. 

( 29 . 3 ) Subtrai-se a media de cada valor. 

( 29 . 4 ) De cada valor subtrai-se a media e em seguida divide-se pelo desvio padrao 

30 . A media aritmetica entre dois valores e igual a 5 e a media geometrica igual a 4 
harmonica entre estes dois valores? 


. Qual a media 
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5. RESPOSTAS DOS EXERCICIOS 


( 01 ) Mes (Qualitativa ordinal) ; Tipo de produto (Qualitativa nominal); Vendedor (Qualitativa 
nominal); Regiao do pais (Qualitativa ordinal); Unidades vendidas (Quantitativa discreta); Total de 
vendas (Quantitativa contmua). 


(02) Nao, pois a soma dos desvios e diferente de zero. 


(03) Nao, pois o calculo deve ser realizado atraves da media ponderada e nao da media aritmetica 


simples. 

(04) 60,50 

(05) 55 

(06) (6.1) Amodal 

(6.2) 5 

(6.3) 4 e 10 

(6.4) 18 


(07) (7.1) 8 

(7.2) 0,02 

(7.3) 7/16 



(08) (8.1) (a) 2,31 

(b) 0,77 

(c) 0,74 

(d) 0,86 

(e) 99,90% 

(8.2) (a) 37/12 

= 3,08 (b) 149/180 = 0,83 

(c) 1,03 

(d) 1,02 

(e) 508,01% 

(09) Observe que o 

conjunto em (b) e igual ao conjunto em (a) multiplicado por 20 e o conjunto em (c) 


e igual ao conjunto em (a) multiplicado por 20 e subtrafdo de 10 unidades. 


( 10 ) ( 10 . 1 ) 


Numero de livros 

Numero de alunos 

0 

7 

1 

9 

2 

8 

3 

7 

4 

4 

5 

2 

6 

2 

8 

1 

Total 

40 


(10.2) 24/40 = 60% 

(10.3) 9/40 = 22,5% 

(10.4) Distribui§ao por ponto ou valores 


( 11 ) ( 11 . 1 ) 


Variavel 

Frequences 

0 1 - — 2 

5 

2 1 - — 4 

12 

4 1 - — 6 

14 

6 1 - — 8 

5 

8 1 - — 10 

4 

i 

40 


( 11 . 2 ) 


0,2100 

0,1800 

0,1500 

0,1200 

0,0900 

0,0600 

0,0300 

0,0000 


□ fr/h 













- 



0 I— 2 


2|-4 


4|-6 


6 |— 8 


8 | — 10 


(11.3) Assimetrica positiva 


0,2100 

0,1800 

0,1500 

0,1200 

0,0900 

0,0600 

0,0300 

0,0000 



-1 1 3 5 7 9 11 
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(12) (12.1) Zona urbana: fr 2 = 0,20 => 20% dos alugueis observados estao entre 3 e 5. 

Zona rural: fr 2 = 0,50 => 50% dos alugueis investigados ente entre 3 e 5. 

(12.2) Zona urbana: F 3 = 130 => 130 alugueis investigados sao menores do que 7. 

Zona rural: F 3 = 95 => 95 alugueis investigados sao menores do que 7. 

(12.3) Zona urbana: Fr 4 - Fr 2 = 0,90 - 0,25 = 0,65 = 65% dos alugueis estao entre 5 e 9. 
Zona rural: Fr 4 - Fr 2 = 1,00 - 0,80 = 0,20 = 20% dos alugueis estao entre 5 e 9. 


(13) (13.1) 64% (13.2) 76 (13.3) 56 

(14) (14.1) 0,66 erros (14.2) 0,50 erros (14.3) Zero erros (14.4) 0,84 erros 

(15) (15.1) 2,60% (15.2)2.60% (15.3)2,64% (15.4)0,04% (15.5)1,63% 


Numero de casas por quarteirao 

Numero de quarteiroes 

02 1 - — 16 

8 

16 1 - — 30 

16 

30 1 - — 44 

4 

44 1 - — 58 

6 

58 1 - — 72 

9 

72 1 - — 86 

3 

86 1 - — 100 

4 

1 

50 


(16.2) 41,76 casas (16.3) 33,50 casas (16.4) 686,86 casas (16.5) 20,67 e 21,60 casas 

(17) (17.1) 1,85 filhos (17.2) 2 filhos (17.3) 2 filhos (17.4) 1,30 filhos 

(18) E a variavel A cujo coeficiente de variagao e 0,20, o menor dentre as 3. 

(19) E a variavel B cujo coeficiente de variagao e 0,12, o menor dentre as 2. 

(20) x = 17,50 S 2 = 36 (21) g = 50% (22) g = 0,5357 = 53,57% 

(23) x = 8,70 sm s = 3,20 sm 

(24) (24.1) Deve ser maior que 20. (24.2) Seria 20, pois 20 e o centra da distribuigao. 

(25) Que 50% dos profissionais recebem ate 6 sm. (26) (26.1) Sim, em media. (26.2) Nao. 

(27) A comparagao pretendida deve ser feita pelas medias. As famflias de base cultural alema tern, em 
media, 5,23 membros, enquanto que as de base italiana tern 5,10. Entao as de base alema tern o 
habito de ter famflias maiores. 

(28) (28.1) 4,58 sm (28.2) 4,51 e 2,12 sm (28.3) 4,25 sm (28.4) 3,89 sm e 3,86 sm 

(28.5) 5,49 e 2,55 sm (28.6) 5,08 e 2,12 sm 

(29) (29.1) A media e o desvio padrao ficam multiplicados por 2. 

(29.2) A media fica somada de 10 e o desvio padrao nao se altera. 

(29.3) A media fica igual a zero e o desvio padrao nao se altera. 

(29.4) A media fica igual a zero e o desvio padrao fica igual a um. 

(30) 3,2 
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